Definindo o Padrão-Ouro: EQM
Para quantificar quão distante nossa estimativa $T$ está da realidade $\psi(\theta)$, definimos o Erro Quadrático Médio (Definição 6.3.1):
$$MSE_\theta(T) = E_\theta((T - \psi(\theta))^2)$$
Este é a distância quadrática média entre nosso estimador e o alvo. Um estimador perfeito teria um EQM igual a zero, mas num mundo de ruído aleatório, buscamos minimizá-lo.
Teorema 8.1.1: A Arquitetura do Erro
Por que um estimador falha? O Teorema 8.1.1 fornece o plano. Se $T$ tem um segundo momento finito, o erro em relação a qualquer constante $c$ é dado por:
Esta fórmula revela que o erro quadrático total é minimizado apenas quando escolhemos $c = E(T)$. No contexto da inferência, definimos $c = \psi(\theta)$, levando à famosa decomposição:
EQM = Variância + Viés$^2$
O Trade-off entre Precisão e Acurácia
Imaginemos duas balanças em um laboratório de controle de qualidade:
- O Relíquia Precisa: Dá sempre o mesmo peso (baixa variância), mas está mal calibrada em 2 gramas (alto viés).
- O Sábio Errático: É correto em média (viés zero), mas oscila amplamente entre medições (alta variância).
O Teorema 8.1.1 permite calcular exatamente qual balança oferece o menor erro total. Muitas vezes, estamos dispostos a aceitar uma pequena quantidade de desvio sistemático (viés) se isso reduz drasticamente o ruído (variância).
Exemplo 8.1.1: Sufficiência e Informação
A otimalidade está ligada a Informação. Considere um espaço amostral $S = \{1, 2, 3, 4\}$. Se os resultados 2, 3 e 4 forem igualmente prováveis sob qualquer parâmetro possível, eles carregam a mesma verossimilhança. Podemos definir uma estatística suficiente $U$ que agrupa esses resultados sem perder qualquer capacidade de fazer uma inferência ótima. Como mostrado na simulação, se $L(\cdot|2) = L(\cdot|3) = L(\cdot|4)$, um estimador ótimo trata esses eventos como um único evento informativo.